AI 用游戏大胜人类的背后,其实是生物学
By 超神经
美国当地时间 6 月 25 日,OpenAI 宣布由其研发的 5 个神经网络组成的 AI 算法 OpenAI Five,已经能打败 Dota2 的人类玩家队伍,这是 AI 首次在 Dota 2 五对五团战中打败人类,且平均天梯分数超过 4200 分。不过目前被 AI 击败的人类团队均为业余玩家,OpenAI 表示,将在今年 8 月份的 Dota 2 - The International 2018 赛事期间,与国际顶尖职业团队一决高下。
细思恐极,未来我们玩游戏时,对面的玩家是人还是 AI 真的分不清了。请答应我,不要教 AI 装女声小姐姐来欺骗我们的感情。
AI 基本在所有游戏里都战胜了人类
早在 1997 年,IBM 的「深蓝」击败了当时的国际象棋世界冠军卡斯帕罗夫,这是机器第一次在比赛中击败世界冠军。到本世纪早中期,这项技术已经进步到了一定程度,在几乎所有不同玩法的国际象棋中,机器都在不断地打败国际象棋大师。
于是计算机科学家们又把研究的注意力转向围棋,这是一个来自中国的古老的策略游戏,非常容易学会,但是很难做到精通。
卡内基梅隆大学的一个研究小组在 2017 年 1 月举办了一场更加公开的活动,当时它的 Libratus AI 系统花了 20 天时间,与四名专业的扑克玩家一起玩了 12 万局无限注的德州扑克。
在经过近一个月的不间断游戏之后,这台机器总共赢了170万美元,而这4位专业人士中的每一位都损失了数千美元的虚拟货币。
2017 年 5 月,AlphaGo Master 打败了柯洁——世界上排名第一的围棋选手。在 AlphaGo 和柯洁对战的三场比赛中,这台机器一直处于优势地位。
到 2017 年 12 月,DeepMind 推出了一个更先进的系统版本。这款名为 AlphaZero 的新人工智能可以在几小时内掌握多种游戏,简直太 IMBA 了。
先解决生物学问题,再解决技术问题
在这些游戏中,不可否认 Dota2 是难度最高、策略最为复杂的游戏之一,大部分时间里,玩家都面临着在需要在游戏中探索方位。
所以首先需要解决的就是角色的导航问题,这时候就先要邀请生物学家先来解释,人脑是如何进行导航的。
探索人脑的奥秘可以说是一件难度系数 9.9 以上的任务,但站在巨人肩上的 Deepmind 不费吹灰之力就找到了问题的答案。这里要特别感谢 2005 年诺贝尔生理或医学奖获得者英裔美国科学家 John O'Keefe(约翰·奥基夫),及来自挪威的 May-Britt (梅-布里特)和他的丈夫 Edvard Moser(爱德华·莫泽)。
通过不懈努力历经千辛万苦,他们找到人脑 GPS 的核心——「网格单元」,这让 Deepmind 轻松发现人脑空间感知的关键。网格单元是一种神经元组织,由无数个网格细胞构成,主要功能是帮助人类及大多数哺乳动物给自己定位和导航。
当我们在移动时,网格单元会不断更新当前所在位置和周边环境,并记录下行走路径和历史位置,然后在大脑里绘制出一张虚拟地图,帮助大脑确定位置和方向。
每到一个新的地方,网格细胞就会自动绘制一张新的地图。也就是说你到过的地方越多,这张地图就越全,你的空间感知范围也就越大。
AI 版网格单元
在该成果的启发下,Deepmind 团队联合 UCL(伦敦大学学院)科学家,共同开发出一套递归神经网络系统。该系统在模拟小白鼠寻找方向的过程中,神奇的发现神经网络产生了类似网格单元在确定位置时的一些特征。
(图注:神经网络生成的网格单元跟人类很类似)
通过进一步研究和改进,他们成功打造出神经网络版网格单元(也叫 AI 网格单元)。AI 网格单元不仅能判断自身位置,还能在复杂的环境里找到通向目标点的最佳路线。
这个发现让 Deepmind 团队喜出望外,他们迫切需要一次机会来秀一把真正的技术。于是,团队决定跳过小白鼠和大猩猩,直接向人宣战。
在一场与专业玩家对战的迷宫游戏里,搭载神经网络版网格单元的 AI 不仅在复杂的环境里找到方向,还准确计算出到目标点的距离,并找到最快行进路线(包括其他一些耗时较长的路线),成功战胜人类。
虽然只是在虚拟环境中取得胜利,但这意味着 AI 有能力在不借助 GPS 等外部数据的前提下,在实际场景中找到方向。因此,Deep mind 刷存在的同时,也不可否认这是一次里程碑式的胜利。
此前,AI 仅被证明在图像识别、棋牌游戏等领域有过人之处,但很少能在像导航这种主观认知领域超越人类。而这次 AI「进化」出自动导航功能,证明 AI 不仅能复制大脑,还能很好的理解大脑。
脑洞时间
可以预见的是,在未来 AI 将拥有更多可能性。依靠其强大的计算和学习能力,它能对同一个问题得出若干种解决方案,并找出最佳答案。
就游戏来说,如果不断去训练 AI 适应各种游戏环境,再配上 Google Assistant 真假难辨的声音。
我们怕是更难分清对面的游戏玩家,究竟是个小姐姐还是 AI 了。
所以 Sad.
超神经小百科
单词
MMOG 大型多人在线网络游戏
Massively Multiplayer Online Games
reinforce
[ˌri:ɪnˈfɔ:rs] vt. 强化
词组
graphics rendering 图形渲染
realistic interaction 真实感交互
历史文章(点击图片阅读)
《翻译「三体」的科幻作家,在小说里发币了》
《嘿!图灵,生日快乐》
《 游戏:发展深度学习的强助攻》
超神经HyperAI
公众号ID:HyperAI
关注